distancia                  package:unknown                R Documentation

Esta funo calcula e retorna uma matriz de distncias entre as linhas de uma matriz de dados. 


Description:

Esta funo calcula e retorna uma matriz de distncias entre objetos. A matriz de dados deve conter nas linhas os objetos a serem comparados e nas colunas, as atribuies de cada objeto. As distncias sero calculadas a cada par de objetos (linhas) e apresentadas na forma de matriz.

Usage:

distancia(x,freq="ABS",method="BRAY-CURTIS")
distancia(x,freq="ABS",method="EUCLIDEAN")
distancia(x,freq="ABS",method="JACCARD")
distancia(x,freq="ABS",method="MORISITA")
distancia(x,freq="ABS",method="MANHATTAN")


Arguments:

x   matriz de dados onde linha  objeto a ser comparado e colunas as atribuies de cada objeto.
freq    valor lgico que indica se matriz de dado deve ser convertido em frequencia relativa ou manter em valores absolutos
method    indoca mtodo a ser aplicado para o calculo das distncias. As opes disponpiveis so: BRAY-CURTIS, EUCLIDEAN, JACCARD, MORISITA, MANHATTAN. 



Details:

As linhas da matriz de dado deve conter os objetos a serem comparados, por exemplo, as amostras. As colunas contero as atribuies do objeto, por exemplo, espcies. A definio dos parmetros freq e method so de preenchimento obrigatrio. O mtodo de calculo da distncia a ser aplicado deve estar escrito em maisculo conforme os exemplos. Valores NA presentes na matriz de dados sero substitudos por zero.



freq="ABS": valores da matriz de dado sero mantidos. 
freq="RELATIVE": valores da matriz de dados original sero convertidos em valores relativos. Os valores de cada colunas sero divididos pela somatria de cada linha. 

Method:

EUCLIDEAN: corresponde a distncia geomtrica entre dois objetos no plano. Corresponde a distncia em linha reta entre dois pontos obtida pelo comprimento da hiponetusa de um tringulo retngulo onde dados dois pontos (X1, Y1) e (X2, Y2) a distncia  calculada como sqrt((Y1-Y2)^2+(X1^2)-X2).Distancia pode variar de 0 a infinito

BRAY-CURTIS: Baseado nas distncias calculadas a partir do mdulo das diferenas de densidades entre as amostra para uma dada espcie. Distancia varia de 0 (similar) a 1 (dissimilar).

B= sum(Xij-Xjk)/sum(Xij+Xjk), onde B = distncia calculada, Xij e Xjk = nmero de indivduos da espcie i nas amostra j e k, sum= somatria

MANHATTAN (ou city-block): distncia baseada na soma das diferenas absolutas das variveis

M = sum(abs(Xij-Xik)); M = distncia, X=objeto i, Y= objeto j


MORISITA: ndice proposto por Morisita (1959) para medir a similaridade entre duas comunidades.  interpretado como probabilidade de que um indivduo retirado da amostra j e um um indivduo retirado da amostra k pertenam  mesma espcie, dividido pela probabilidade de que dois indivduis retirados das amostra j e k pertenam  mesma espcie. Varia entre 0 a 1, empregado em dados de abundncia


JACCARD: definido pelo tamanho da interseo dividido pelo tamanho da unio dos itens de dois conjuntos. Baseia em dados de presena e ausncia onde 1  presena e 0, ausncia. Valores da matriz de dados so convertidos em matriz de 0 e 1, onde 1  assumido para todos os valores maior que 0 da matriz original.Distncia de Jaccard Obtido por:

J = c/ a+b-c

Onde: J = Coeficiente de Jaccard a= numero de atributos do objeto 1 b= numero de atributos do objeto b, c= numero de atributos comuns a ambas objetos.


Value:

A funo retorna uma matriz de distncias calculadas entre objetos (linhas)

x:  uma tabela de dados com clase data.frame

freq: "ABS"" ou "RELATIVE".

method: "BRAY-CURTIS", "EUCLIDEAN", "JACCARD", "MORISITA", "MANHATTAN"



Warning:
Valores NA presentes na matriz de dados sero substitudos por zero.
freq e Method so de preenchimento obrigatrio e devem estar entre "aspas" e MAIUSCULA, conforme exemplo: distancia(x,freq="ABS",method="BRAY-CURTIS")




Author(s):

Nancy Kazumi Taniguchi
nancykazumi@usp.br


References:

BRAY, J. R. & CURTIS, J. T. 1957. An ordination of the upland forest communities of Southern Wisconsin. Ecological Monographs, 27: 325-349.

HAIR, Black, Babin, Anderson & Tatham - Anlise multivariada de dados (6a edio) - Bookman (2006). 

Krebs, C.J.; 2001. Ecology: the experimental analysis of distribution and 
abundance. Benjamin Cummings, an imprint of Adisson Wesley Longman, Inc.. San 
Francisco, California.

Krebs, C.J. 2013. Ecological Methodology, 3rd ed. (in prep)
Chapters revised to date (14 March 2013) are available to download for evaluation and review (PDF files) http://www.zoology.ubc.ca/

Pinto-Coelho, R.M.; 2000. Fundamentos em ecologia. Artmed Editora. Porto AlegreRS, 252p. 

Zar, J.H.; 1999. Biostatistycal analysis. 4 Edio. Prentice-Hall, New Jersey.


Examples:

#construindo uma matriz de dados
especies <- c("especie1","especie2","especie3","especie4","especie5","especie6","especie7","especie8","especie9","especie10")
amostra1 <- rpois(10,5)
amostra2 <- rpois(10,5)
amostra3 <- rpois(10,5)
amostra4 <- rpois(10,5)
amostra5 <- rpois(10,5)

dado <- data.frame(amostra1,amostra2,amostra3,amostra4,amostra5)
dado <-t(dado)
colnames(dado) <- paste(especies)
rownames(dado) <-paste(c("amostra1","amostra2","amostra3","amostra4","amostra5"))
dado

#executando a funo para planilha dado construda
distancia(dado,freq="ABS",method="BRAY-CURTIS")
distancia(dado,freq="RELATIVE",method="BRAY-CURTIS")
distancia(dado,freq="ABS",method="EUCLIDEAN")
distancia(dado,freq="RELATIVE",method="EUCLIDEAN")

#teste com arquivo csv e valores NA presentes na matriz de dados.
# primeiramente faa o download do arquivo Planilha_teste.csv disponpivel no link junto com a funo
teste <- read.table("Planilha_teste.csv", row.names=1, header=T, sep=";", dec=",", as.is=T)

#executando a funo para planilha teste
distancia(teste,freq="ABS",method="BRAY-CURTIS")
distancia(teste,freq="RELATIVE",method="BRAY-CURTIS")
distancia(teste,freq="ABS",method="EUCLIDEAN")
distancia(teste,freq="ABS",method="JACCARD")
distancia(teste,freq="ABS",method="MORISITA")
distancia(teste,freq="ABS",method="MANHATTAN")



    
